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摘 要 : 枫 香 是 广西 重要 的 乡土 树种 之 一 ， 有 着 较 高 的 用 材 、 观 赏 及 药 用 价值 ， 该 文 基于 枫 香 转录 组 测 
序 结果 进行 ESTSSR 引物 开发 ， 可 为 枫 香 群体 遗传 学 研究 的 开展 提供 有 效 、 可 靠 的 分 子 标记 工具 ， 对 于 
该 树种 的 保护 、 开 发 和 利用 有 着 重要 的 意义 。 研 究 基于 转录 组 测序 技术 ， 检 测 枫 香 SSR 位 点 并 设计 引物 ， 
通过 PCR 扩 增 和 聚 丙烯 酰胺 凝 胶 电 泳 盘 选 出 具有 较 高 多 态 性 的 枫 香 EST-SSR 引物 ， 并 通过 对 1 个 枫 香 天 
然 群体 进行 遗传 多 样 性 分 析 验 证 这 些 SSR 引物 实际 应 用 效果 。 结 果 表明 : 《1) 基于 转录 组 测序 得 到 的 枫 
香 SSR Unigene 中 共 发 掘 到 23 777 个 SSR 位 点 ， 单 核 苷 酸 重复 类 型 SSR 位 点 占 总 位 点 比例 最 高 
(46.54%) 。 重 复 次 数 上 ，5~12 次 之 间 的 SSR 位 点 占 比 最 高 (72.36%) 。 〈2) 共 开 发 出 262 对 SSR 引 
物 ， 有 效 扩 增 率 为 53.1%， 最 终 往 选 出 扩 增 稳定 、 条 带 清晰 的 引物 18 对 。 (3) 多 态 性 检测 结果 表明 ， 所 
位 点 均 具有 多 态 性 ; 天然 群体 遗传 多 样 性 结果 显示 ， 该 天 然 群体 中 等 位 基因 数量 (Na) 、 有 效 等 位 基 
因数 量 (Ne) 、Shonnon 信息 指数 (17) 、 观 察 杂 合 度 (Ho) 变化 范围 分 别 为 2~4、1.112 8~2.609 6、 
0.208 9~1.112 7 和 0.275 9~1.000 0， 平 均值 分 别 为 2.333 3、1.957 4、0.708 5 和 0.722 6。 综 上 所 述 ， 在 枫 
香 中 占 优势 的 SSR 位 点 重复 类 型 和 重复 基 序 与 其 他 物种 基本 相同 ; 本 研究 所 开发 的 18 对 枫 香 EST-SSR 
引物 可 以 满足 开展 枫 香 群体 遗传 学 研究 的 需要 ， 为 后 续 枫 香 种 群 遗 传 多 样 性 研究 提供 了 丰富 的 标记 引物 。 
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Abstract: Liguidambar formosana is one of the important native tree Species in Guangxi, which has high timber, 
ornamental and medicinal value. This study designs and develops EST-SSR markers of L. formosana based on 
data from the transcriptome sequencing. The purpose is to provide an effective and reliable molecular marker tool 
for studies of population genetics of this species, lt ls of great significance to the protection and utilization of all 
kinds of material resources of the tree. Simple sequence repeats were selected from the transcriptome data in L. 
formosana, and then primers were developed, and screened out by PCR amplification and polyacrylamide gel 
electrophoresis for high polymorphism, and the efficiency was tested by using 30 individuals from of a wild L. 
formosana population. The results were as follows: (1) A total 23 777 SSRs were obtained by searching SSR 
unigenes from transcriptome data. The repeat type of the SSR loci in L. formosana was dominated by 
mononucleotide repeats (46.54%). The highest proportion of SSR loci (72.36%) was between 5 and 12 times. (2) 
A total of 262 pairs of SSR primers were developed, and among them, 139 pairs amplified the target bands with a 
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success rate of $3.1%, and 18 pairs of them that can be used to steadily obtain clear bands were finally identified. 


(3) The polymorphism detection showed that all sites had a high degree of polymorphism. The number of alleles， 


effective alleles, Shannon diversity index, observed heterozygosity and fixed index of the L. formosana 
populations ranged in 2-4, 1.112 8-2.609 6, 0.208 9-1.112 7 and 0.273 9-1.000 0, the average values were 2.333 
3, 1.957 4, 0.708 5 and 0.722 6, respectively. In conclusion, the dominant SSR repeat type and repeat motif in L. 


formosama are basically the same as those in other species, the developed EST-SSR markers can meet the needs 


of population genetic studies of L. formosana, which provides abundant primers for the study of genetic diversity 


of L. formosana. 
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枫 香 (Liquidambar formosana) 是 金 缕 梅 科 


木 ， 主 要 分 布 于 秦岭 淮河 一 线 以 南 ， 广 西 全 境 都 
j 植 物 之 一 ， 枫 香 树 皮 避 


作为 我 


的 观 贫 价值 。 


国 


传统 药 


显 的 作用 ， 叶 片 有 着 清热 解毒 的 功效 ， 更 是 / 
什 。 枫 香 还 有 着 较 高 的 月 


( 范 绍 斌 等 ，2021) ， 


最 常用 的 技术 ( 易 浪 》 


本 


I 序 (RNA-seq) 技术 被 
) ， 转 录 组 测序 技术 能 够 快速 
E 奇 等 ，2020) ， 通 过 对 转录 组 测序 数据 进行 挖掘 分 析 ， 可 以 得 到 SSR 位 


2017 
阶段 物种 基因 功能 及 结构 〈 刘 但 
点 分 布 特征 ， 从 而 为 后 期 SSR 引物 的 筛选 和 设计 提供 数据 参考 ( 叶 鹏 等 ，2019)。 简 单 重复 序列 〈simple 
sequence repeats，SSR) 叉 称 为 微 卫星 DNA， 指 | 


的 重复 序列 ，SSR 在 真 核 生 物 整个 基因 


日 材 价 值 ， 可 月 
其 适应 力 强 、 耐 贫 将 ， 对 于 一 些 
2020) ， 常 作为 生态 结构 、 林 种 结构 调整 的 有 

近 些 年 来 ， 转 录 组 六 


办 


(Hamamelidaceae) 枫 香 属 (Ligquidambar)〉 的 彩 叶 落叶 乔 
9 分布 。 叶 片 春 夏 呈 青 绿色 ， 秋 季 时 深 红 色 ， 具 有 较 高 
于 通 经 活络 ， 果 子 对 于 消化 不 良 等 病症 有 着 明 


西 壮族 “三 月 三 ”传统 节日 中 制作 五 色 米饭 不 可 或 缺 的 重 
日 于 制作 家 有 具 或 建材 。 除 此 之 外 还 有 着 维护 地 力 的 重要 价值 


EE 要 树种 ， 因 此 有 着 较 高 的 研究 价值 。 
六 泛 应 用 到 分 子 生物 学 领域 ， 逐 渐 成 为 分 子 生物 学 研究 


毒气 体 如 Ch 、SO* 有 着 较 强 的 抗 性 〈 赖 玖 奢 ， 


效 地 获得 基因 序列 ， 并 从 整体 上 揭示 特定 


T 


1~6 个 核 苔 酸 为 重复 单元 串联 组 成 的 长 达 几 十 个 核 昔 酸 


的 优点 ， 被 广泛 应 用 了 


物 


位 和 分 子 标记 


甫 助 育 种 等 


之 一 。 按 其 来 源 可 分 为 基因 
两 类 。 其 中 ，G-SSR 标记 基于 


序列 标签 ， 除 具 


遗传 多 柱 


组 内 都 有 存在 ， 有 着 数量 丰富 、 多 态 性 高 、 重 复 性 好 、 特 异性 强 
性 分 析 、 遗 传 连锁 图 谱 的 构建 〈 张 利 达 和 唐 克 轩 ，2010) 、 基 因 定 


究 ( 杨 雄 等 ，2021)， 被 视 为 检测 群体 遗传 多 样 性 和 群体 间 遗 传 分 化 最 有 效 标记 


枫 香 作为 我 国 重要 乡土 树 


( 韦 理 电 等 ，2016) 及 新 品种 
较 少 ， 其 原因 主要 是 缺乏 足够 上 
敏 等 


基因 


(王建 军 等 ， 


组 SSR (G-SSR) 和 基于 表达 序列 标签 (expressed sequence tag，EST) 的 SSR 
组 序列 ， 其 开发 过 程 繁 复 、 成 本 高 、 效 率 低 ; EST-SSR 标记 基于 表达 
9 G-SSR 标记 的 优点 外 ， 还 具有 序列 保守 性 较 高 ， 在 植物 同属 不 同 物 
的 优点 ( 王 丹 丹 和 杨 东 霞 ，2017)。 


' 间 


9 较 好 通用 性 


之 一 ， 国 内 主要 开展 了 生理 性 质 分 析 〈 尹 国平 等 ， 
2015) 认定 等 工作 。 关 于 枫 香 群 
的 分 子 标 记 ， 以 往 对 枫 香 遗传 多 样 性 的 而 
2021) 探索 了 最 适 的 枫 香 叶片 DNA 的 提取 方法 ， 最 优 ISSR 引物 和 最 佳 ISSR-PCR 扩 增 反应 体系 ; 
毕 则 奢 等 〈2010) 通过 ISSR 分 子 标记 技术 分 析 了 枫 香 
DNA 提取 及 SRAP-PCR 反应 
位 点 的 检测 、 杂 合子 


多 ， 当 


2021) 、 人 工 林 培育 
本 遗传 学 方面 研究 相关 报道 
究 主 要 采用 显 性 分 子 标 记 ， 如 黄 


然 群体 遗传 多 样 性 ; 李 芳 入 “(2015) 优化 了 


体系 的 方法 等 。 相 较 而 言 ，ISSR 标记 实验 重复 性 较 SSR 标记 差 ， 在 多 等 位 
区 分 及 基因 分 型 等 方面 无 法 具备 SSR 标记 的 功能 ; 
j 多 个 引物 组 合 来 构建 品种 指纹 图 谱 时 ， 指 纹 的 识别 和 鉴定 相 较 SSR 标记 更 为 困难 〈 刘 振 等 ， 


而 SRAP 标记 的 扩 增 谱 带 过 


2014) ，SSR 分 子 标记 可 揭示 的 遗传 信 


县 相对 较 高 ， 明 显 优 于 其 他 传统 分 子 标记 ( 刘 粉 粉 等 ，2021) ， 但 


当前 关于 枫 香 SSR 引物 开发 的 报道 相对 较 少 。 前 人 的 研究 中 主要 通过 磁 珠 富 集 法 〈 顾 辛 韵 ，2016) 和 从 


NCBI 获取 数据 的 方法 〈 孙 荣 喜 ，2017) 开发 枫 


引物 难度 大 ， 开 发 数量 较 少 的 问题 ， 


体 遗 传 学 研究 。 


由 此 使 得 当 


香 SSR 引物 ， 该 方法 都 存在 着 获得 位 点 信息 较 少 ， 开 发 
前 枫 香 SSR 引物 数量 还 不 足以 支撑 更 深入 地 进行 枫 香 群 


本 研究 以 河池 市 7 个 县 及 贵州 荔 波 县 为 研究 区 域 ， 依 托 转录 组 测序 技术 获得 丰富 且 全 面 的 枫 香 SSR 


位 点 信息 ， 进 行 枫 香 EST-SSR 引物 的 筛选 和 设计 ， 随 后 采用 PCR 扩 增 及 聚 丙 烯 酰胺 凝 胶 电泳 的 方法 得 ; 
出 多 态 性 好 ， 扩 增 稳定 的 枫 香 EST-SSR 引物 ， 并 通过 对 野生 群体 的 遗传 多 样 性 分 析 以 验证 引物 的 应 用 效 
果 ， 拟 讨论 以 下 问题 : 〈1) 枫 香 SSR 位 点 的 具体 分 布 及 主要 的 序列 特征 ; (2) 枫 香 SSR 引物 的 开发 效 
率 如 何 ， 影 响 开 发 效率 的 原因 有 哪些 ; (3) 开发 出 的 枫 香 SSR 引物 多 态 性 情况 及 在 枫 香 遗传 多 样 性 分 析 
当中 的 应 用 效果 。 以 期 为 今后 枫 香 分 子 标记 辅助 育种 、 功 能 基因 标记 等 研究 提供 基础 依据 ， 为 枫 香 群体 
遗传 学 及 遗传 育种 研究 提供 可 靠 研究 工具 ， 为 进一步 开展 广西 境内 枫 香 种 质 资源 遗传 多 样 性 评价 、 栅 香 
分 子 植物 辅助 育种 等 研究 提供 参考 ， 为 栅 香 育种 材料 遗传 多 样 性 及 亲缘 关系 分 析 葛 定 基础 。 
1 材料 与 方法 
1.1 研究 材料 

从 广西 河池 市 环 江 县 随机 选择 一 个 枫 香 天 然 群 体 ， 采 集 其 新 鲜 的 红 、 黄 、 绿 三 种 颜色 的 叶片 分 别 装 
入 50 mL 离心 管 ， 并 放 入 液 氮 中 冷冻 封存 ， 交 由 北京 诺 禾 致 源 生物 信息 科技 有 限 公司 进 行 转录 组 测序 。 
经 查阅 文献 并 实地 考察 后 ， 从 广西 河池 市 7 个 县 及 贵州 荔 波 县 各 选择 1 个 枫 香 天 然 群 体 随机 采集 1 个 机 
香 样 本 (Al~A8) 用 作 引 物 的 初步 筛选 ， 另 在 8 个 天 然 群 体 中 各 采集 2~4 个 枫 香 样本 〈 各 采样 单 株 之 间 
相距 二 50 m) ， 共 计 24 个 枫 香 样本 (B1~B24) 用 作 引 物 的 复 得 及 多 态 性 检测 材料 ， 从 而 保证 实验 材料 
能 够 覆盖 该 试验 区 更 多 天 然 群体 及 个 体 ， 此 外 ， 在 河池 市 环 江 县 另 选 择 一 个 枫 香 天 然 群 体 采集 30 个 样本 
CCI~C30) 用 作 遗 传 多 样 性 分 析 的 实验 材料 。 材 料 具体 来 源 如 表 1 所 示 。 

表 1 枫 香 实验 材料 来 源 地 


Table 1 Sources of Liquidambar formosana experimental materials 


= 


编号 材料 来 源 经 纬度 
No. Source of materials Longitude and latitude 
西河 池 南 丹 县 107°20'56" E 
Al, Bl1~B4 
Hechi Nandan County, Guangxi 25°23'38”N 
西河 池 天 峨 县 107?11'30" 了 
A2，B5~B6 
Hechi Tian’e County, Guangxi 25°08'06"N 
西河 池 凤 山 县 106"54'44" E 
A3，B7~B8 
Hechi Fengshan County, Guangxi 24"31'36" N 
西河 池 东 兰 县 107°29’10"E 
A4，B9~B10 
Hechi Donglan County, Guangxi 24"2738"N 
广西 河池 金城 江 区 108°33'36"E 
A5, Bll~B14 
Hechi Jinchengjiang District, Guangxi 24°34'58”"N 
西河 池 环 江 县 108"33'31" 了 
A6, B15~B18 
Hechi Huanjiang County, Guangxi 25°17'16"N 
西河 池 宜 州 区 108°45'52"E 
A7, B19~B21 
Hechi Yizhou District, Guangxi 24°34'17"N 
贵州 功 波 县 108*07'55"E 
A8, B22~B24 
Libo County, Guangxi 25°15'25”"N 
广西 河池 环 江 县 108°33'02" E 
C1~C30 
Hechi Huanjiang County, Guangxi 25°18'41”"N 


1.2 枫 香 转录 组 测序 

主要 从 以 下 方面 对 测序 过 程 进行 把 控 。 (1) 对 样品 质量 检测 : 琼脂 糖 凝 胶 电泳 分 析 RNA 降解 程度 
以 及 是 否 有 污染 Nanodrop 检测 RNA 的 纯度 (OD260/280 比值 ); Qubit 对 RNA 浓度 进行 精确 定量 ;A 
gilent 2100 精确 检测 RNA 的 完整 性 ， 从 而 保证 RNA 的 完整 性 和 总 量 。 (2) 使 用 Oligo (dT) 磁 珠 富 集 


的 方法 构建 全 长 转录 组 文库 ， 在 PCR 扩 增 富 集合 成 的 cDNA 时 ， 通 过 循环 优化 确定 PCR 的 最 佳 条 件 ， 从 
而 保证 文库 构建 质量 ， 经 检验 合格 后 ， 根 据 文库 的 有 效 浓度 及 数据 产 出 需求 运用 PacBio Sequel 平台 进行 
测序 。 从 而 保证 最 终 得 到 的 SSR 位 点 信息 有 效 可 靠 。 
1.3 枫 香 EST-SSR 标记 开发 
对 转录 组 测序 挖掘 到 的 枫 香 转录 组 中 SSR 位 点 进行 第 选 ， 筛 选 的 标准 是 序列 长 度 单位 范围 为 16~28 
bp，2 个 碱 基 单 元 的 重复 次 数 大 于 9 次 ，3~6 个 碱 基 单元 的 重复 次 数 为 $ 次 或 大 于 5 次 ， 单 碱 基 单 元 排除 
在 外 ， 上 、 下 游 引 物 退火 温度 差 不 超过 3 心 等 条 件 开 发 设计 SSR 引物 ， 交 由 广州 艾 基 生物 有 限 公 司 进行 
引物 合成 。 
1.4 枫 香 基因 组 DNA 提取 
本 研究 使 用 快捷 型 基因 组 DNA 提取 系统 提取 枫 香 DNA (〈 王 菇 等 ，2013) ， 随 后 用 分 光 光 度 计 对 提 
取 后 的 DNA 进行 纯度 与 浓度 检测 ，OD260/OD280 值 应 为 1.7~1.9。 随 后 通过 1% 琼 脂 糖 电泳 检验 DNA 质 
量 ， 将 符合 要 求 的 模板 DNA 稀释 到 50 ng:nL-1， 放 置 于 -20 °C 冰箱 中 备用 。 
1.5 PCR 扩 增 
PCR 扩 增 反应 总 体积 为 10 uL， 其 中 包含 2 pL DNA (50 ng:hLD ，1 hL PCR Buffer (10x) ， 
0.2 hL dNTPs， 上 下 游 引 物 各 0.25 hL，0.07 pL Taq DNA Polymerase (5 UL ) ， 及 6.23 kL 的 ddH2 
OQ， 该 扩 增 反应 在 PCR 仪 上 完成 。SSR-PCR 扩 增 的 程序 : 94 °C 预 变 4 min，94 °C 变性 15 s，55 °C 复 
变性 15 s，72 °C 延伸 30 s，30 个 循环 ，72 °C 延伸 20 min，12 °C 保存 。 
1.6 引物 有 效 性 及 多 态 性 检测 
将 PCR 扩 增 后 的 产物 通过 8% 聚 丙烯 酰胺 凝 胶 电 泳 进行 分 离 ， 实 验 步 又 为 : 使 用 移 液 枪 吸取 1.2 pL 
的 滴 加 了 涡 酚 蓝 指示 剂 的 扩 增 引物 点 在 聚 丙烯 酰胺 胶 板 上 ， 凝 胶 首 尾 点 1 hL 50~500 bp Marker， 在 240 
V 恒 压 下 电泳 ， 通 过 省 酚 蓝 指 示 剂 调整 电泳 时 间 。 电 泳 结束 后 将 凝 胶 使 用 ddH2O 清洗 2 次 ， 放 入 固定 液 
中 震荡 10 min， 随 后 取出 凝 胶 放 入 超 纯 水 中 震荡 清洗 2~3 次 ， 每 次 2 min。 清 洗 后 将 胶 板 放 入 银 染 液 中 
进行 银 染 ， 震 荡 7 min; 银 染 后 再 次 放 入 蒸馏 水 中 震荡 清洗 2~3 次 ， 每 次 2 min。 将 清洗 后 的 凝 胶 放 入 显 
影 液 中 震荡 ， 直 至 胶 板 上 出 现 清晰 条 带 为 止 。 用 ddH2O 清洗 凝 胶 2 次 后 读 条 带 并 拍照 保存 。 
17 数据 统计 
人 工 进行 条 带 判读 ， 通 过 是 否 扩 增 出 有 效 条 带 判断 引物 有 效 性 。 对 具有 有 效 性 的 引物 ， 其 不 同 扩 增 
产物 按 条 带 长 度 从 大 到 小 用 A, B, C.…. 进行 编号 ， 汇 总 后 通过 Popgene 32 软件 计算 以 下 参数 : (1) 观 
测 等 位 基因 数目 (observed number of alleles，Na) ; (2) 有 效 等 位 基因 数目 (effective number ofalleles，Ne) 
(CHartl et al., 1989) ; (3) Shannon 多 样 性 指数 (Shannon’s information index，7Z) (Shannon et al., 1949) ; 
(4) 观测 杂 合 度 (observed heterozygosity，Ho) ; (5) 期 望 杂 合 度 ( expected heterozygosity, He) (Neiet 
al., 1973) 。 通 过 PIC-CALC 软件 计算 PIC (polymorphism information content) 值 (Botstein et al., 1980) ， 
PIC 值 指 多 态 信 息 含 量 ， 是 判断 SSR 引物 多 态 性 的 重要 指标 ， 当 PIC<0.25 时 ， 该 位 点 为 低 度 多 态 性 位 
点 ; 当 0.25<PIC<0.5 时 ， 该 位 点 为 中 度 多 态 性 位 点 ; 当 PIC==0.5 时 ， 该 位 点 为 高 度 多 态 性 位 点 。 计 算 
PIC 值 所 用 到 的 公式 〈 杨 国 忠 等 ，2004) 如 下 : 
n n-l 
PIC=1- >.P -2 2,2P°P (1) 
/一 ] 


i=] i=. 


o 


式 中 :PIC 指 多 态 信息 含量 ， 己 和 局 分 别 表示 第 ;个 和 第 /个 等 位 基因 频率 ; 表示 等 位 基因 数 。 
引物 的 有 效 扩 增 率 指 能 够 有 效 扩 增 的 引物 数量 与 引物 总 数量 的 比值 。 引 物 的 多 态 性 比率 指 具 有 能 够 有 

效 扩 增 且 多 态 性 的 引物 数量 与 引物 总 数量 的 比值 。 

2 结果 与 分 析 


2.1 枫 香 转录 组 中 SSR 位 点 的 分 布 特点 
通过 枫 香 转录 组 测序 共 挖掘 到 23 777 个 枫 香 SSR 位 点 ， 平 均 每 3.13 kb 存在 一 个 SSR 位 点 。 通 过 统 


计 发 现 ， 枫 香 转 录 组 中 SSR 主要 有 单 核 昔 酸 及 二 到 六 个 核 背 酸 等 六 个 简单 重复 单元 类 型 ， 除 此 之 外 还 有 
( 表 2) ， 其 中 单 核 苷 酸 类 型 占 SSR 位 点 总 数 的 46.54%， 
占 SSR 位 点 总 数 的 33.10%， 三 、 四 、 五 、 六 核 背 酸 类 型 分 别 占 SSR 位 点 总 数 的 17.80%、1.17%、0.49%、 


少量 复杂 重复 类 型 


次 则 是 二 核 昔 酸 重复 类 型 ， 


0.88%。 单 核 昔 酸 类 型 中 出 现 频率 最 高 的 是 TA (66.81%) ， 其 次 是 AT (24.99%) ; 在 二 核 芽 酸 类 型 当 
中 ， 出 现 频率 最 高 的 是 CT/AG (24.7%) ， 较 之 稍 少 的 是 TC/GA (23.72%) ; 在 三 核 音 酸 类 型 当中 ， 出 


现 最 多 的 则 是 CAG/CTG (6.17%) ， 次 之 的 是 GAA/TTC (5.08%) ; 
TA/TAAA (17.2%) 


6%， 限 制 了 在 此 基础 


在 四 核 昔 酸 类 型 中 出 现 最 多 的 是 TT 
; 在 五 核 苷 酸 类 型 中 ，CTTTT/AAAAG (8.62%) 上 


8 现 的 频率 最 高 ， 在 六 核 背 酸 类 型 


中 出 现 最 多 的 则 是 ACCAGC/GCTGGT (4.72%) 。 综 上 所 述 ， 枫 香 SSR 位 点 以 单 核 苷 酸 、 二 核 苷 酸 为 主 ， 
K 占 SSR 位 点 总 数 的 79.64%， 适 用 于 设计 引物 的 三 到 六 核 苷 酸 重 复 类 型 位 点 总 数 仅 占 位 点 总 数 的 19.4 
上 开发 枫 香 SSR 引物 的 数量 。 
表 2 枫 香 转录 组 中 SSR 重复 单元 的 分 布 特征 


lm 
Wn 


Table 2 Distribution of the SSR repeat motifs in Liquidambar formosana transcriptome 


核 苷 酸 重 复 类 型 SSR 数量 比例 主要 重复 基 元 〈 数 目 ) 
Type of nucleotide repeat No. of SSR Percentage (%) Main repeat motif (No.) 
单 核 昔 酸 T/A (7394) 
11 067 46. 54 
Mononucleotide A/T (2766) 
轴 CT/AG (1 944) 
二 核 蔡 酸 
7 871 33. 10 TC/GA (1 867) 
Dinucleotide 
AG/ CT (1 162) 
CAG/ CTG (261) 
三 核 苷 酸 GAA/ TTC (215) 
4232 17. 80 
Trinucleotide TCT/AGA (176) 
GCA/ TGC (175) 
四 核 苷 酸 TTTA/ TAAA (48) 
279 1. 17 
Tetranucleotide ATTT/ AAAT (27) 
i CTTTT/ AAAAG (10) 
五 核 苷 酸 
116 0. 49 TICTG/ CAGAA (9) 
Pentanucleotide 
TCTCT/ AGAGA (9) 
和 轩 ACCAGC/ GCTGGT (10) 
六 核 苷 酸 
212 0. 88 ATGGGT/ ACCCAT (9) 
Hexanucleotide 
TCGCTC/ GAGCGA (9) 
总 数 
23 777 
Total 


SSR 重复 次 数 ( 表 3) 在 5~78 次 之 间 ， 主 要 集中 在 5~24 次 之 间 ， 


数量 中 占 比 最 多 的 是 5~8 次 ， 共 有 8 787 个 ， 


复 ， 共 有 8 417 个 ， 


占 SSR 位 点 总 数 的 35.4 


可 


0%， 和 重复 次 数 在 13~16 次 、 


占 SSR 位 点 总 数 的 36.96%， 排 在 第 二 位 的 则 是 9~12 次 台 


其 中 重复 次 数 数量 在 SSR 总 位 点 


th 


17~20 次 和 21~24 次 的 SSR 位 点 


数量 分 别 为 3 934 个 〈16.5$% ) 、1 830 个 (7.70%) 和 598 个 (2.52%) ， 重 复 次 数 大 于 24 次 的 最 少 ， 


立 点 的 多 态 性 由 DNA 复制 过 程 中 的 滑动 错 玫 
香 SSR 重复 次 数 以 5~8 次 为 主 ， 基 本 满足 设计 开发 SSR 引物 的 要 求 。 


有 211 个 ， 仅 占 SSR 位 点 总 数 的 0.89%。 在 所 有 的 习 
个 ， 占 SSR 位 点 总 数 的 1$.01% 。 和 


产生 ，SSR 的 重复 次 数 越 多 ， 该 位 点 的 多 态 性 往往 


表 3 SSR 重复 次 数 


Table 3 SSR repetitions 


EE 复 次 数 当 中 ，10 次 重复 所 占 比例 最 大 ， 有 3 570 
肖 次 之 的 是 6 次 重复 ， 共 有 3 220 个 ， 


占 SSR 位 点 总 数 的 13.54%。SSR 
越 高 ， 枫 


T 


202207.00025V1 


chinaXiv 


ChinaXiv 合 作 期 刊 


重复 次 数 5~8 次 9~12 次 13~16 次 17~20 次 21~24 次 > 24 次 
Repetitions 5-8 times 9-12 times 13-16 times 17-20 times 21-24 times > 24 times 
数量 
8 787 8 417 3 934 1 830 598 210 
Number 
比例 
36. 96 34. 40 16. 55 7. 70 1. 52 0. 89 


Percentage (%) 


2.2 枫 香 EST-SSR 引物 有 效 性 筛选 
如 表 4 所 示 ， 用 8 个 枫 香 样本 (Al~A8) DNA 对 262 对 引物 进行 简捷 有 效 地 初次 筛选 ， 有 139 对 引 
物 能 够 有 效 扩 增 ， 有 效 扩 增 率 为 533.1%， 且 所 设计 的 不 同 核 背 酸 重 复 类 型 的 引物 有 效 扩 增 率 基 本 相同 。 
此 可 认为 本 实验 所 设计 合成 的 各 核 背 酸 重复 类 型 引物 在 枫 香 群体 具有 一 定 的 适用 性 〈 杨 雄 等 ，2021) 。 
表 4 枫 香 ESTSSR 引物 扩 增 结果 
Table 4 Amplification results of EST-SSR primers of Liquidambar formosana 


SSR 核心 类 型 引物 对 数目 有 效 引 物 数目 
Type of SSR core No. of primer pairs Number of effective primers 
二 核 昔 酸 
10 $5 (50.0%) 
Dinucleotide 
三 核 苷 酸 
146 78 (53.4%) 
Trinucleotide 
四 核 音 酸 
76 40 (53.6%) 
Tetranucleotide 
五 核 昔 酸 
30 16 (53.3%) 
Pentanucleotide 
总 计 
262 139 (53.1%) 
Total 


B1~B24. B1~B24 的 24 个 枫 香 个 体 ; M. 500 bp ladder DNA Marker。 
B1-B24. DNA of 24 Liquidambar formosana individuals from Bl to B24; M. 500 bp ladder DNA Marker. 
1 24 份 枫 香 材料 扩 增 结果 (LF229) 
Fig. 1 Amplification of 24 Liquidambar formosana using primer LF229 


2.3 枫 香 EST-SSR 引物 多 态 性 分 析 结 果 
筛选 出 的 139 对 有 效 性 引物 中 ， 能 够 扩 增 出 多 态 性 条 带 的 引物 有 41 对 ， 多 态 性 比率 为 15.64%， 说 明 


I 


栅 香 SSR 序列 的 保守 性 相对 较 强 。 选 取 其 中 18 对 扩 增 稳定 ， 条 带 清晰 ， 有 多 态 性 的 引物 ( 表 $) ， 对 抽 
取 的 24 个 样本 (B1~B24) DNA 进行 多 态 性 检测 ， 并 用 PopGene32 软件 进行 分 析 。 
多 态 性 分 析 结 果 显 示 ，18 个 位 点 的 观测 等 位 基因 数量 (Na) 介 于 2~5 之 间 ， 平 均值 为 3; PIC 值 介 


于 0.30~0.72 之 间 ， 其 中 10 个 位 点 的 PTC>0.30， 具 有 高 度 多 态 性 ， 其 余 8 个 位 点 的 PIC 二 0.25， 具 有 


度 多 态 性 ， 不 存在 低 多 态 性 位 点 。 经 筛选 出 的 18 对 枫 香 SSR 引物 具有 较 高 的 多 态 性 。 
表 5 18 对 SSR 引物 多 态 性 信息 
Table $ Information on polymorphism of 18 pairs of SSR primers 
引物 编号 引物 序列 (5'-3') 重复 基 元 
Annealing temperature 
Primer No. Primer sequence (5'-3') Repeat motif (CoC) 
F: AGGAACCCAATTTGACCCCT 
LFS3 (TGG)6 60.0 
R: CCACCCACCAATGCTCAGAT 
F: CAGCACTTCCATAAAGCCGC 
LF76 (CCAT) $ 60.0 
R: GTTCTGACGCCTTCTGGTGA 
F: TGAAATTTTGCGTGGGCTGG 
LF89 (GGCT)5 37.3 
R: ACAAGTGGGCTCAAATGAGT 
F: GCAATAGCCGTTCCCTTTGC 
LF108 (TICT) $ 60.0 
及: CACGGTCTCACTGCCTGATT 
FE: CGGAGCTCGTGATTTCAGGT 
LF111 (TITC) 5 60.6 
R: AGAACCGGTTCCTCGTAACA 
F: ATCAGTGTGTAGGCCGAACC 
LF112 (TTTG)S 58.6 
R: AGCCAATCACCACACACCAA 
F: CACACCACTCCACTCCGATC 
LF128 (CCA)7 60.0 
R: ATGTTGAGGGAGCGAAGGTG 
F: GTATGATCGCCCTCCCACTG 
LF129 (CCG)7 60.0 
R: ACAGAAGCTGAGGTTGAGGC 
F: ACTCACACTCCCACACTCCA 
LF171 《CCT) 8 60.0 
R: AAACTCGAAGACCCAGCGAG 
F: CCACTGCCTCAGGGTTTCTT 
LF177 (GAAG)6 60.0 
R: CTTCACCTGGAAGTGGGTCG 
F: TTCTGTGACTGGGCAATGGG 
LF188 (TAA) 8 59.8 
R: CGAGTCCTCACATTCCACGT 
F: TGGTGCCTTCTTGGACCTTT 
LF190 (TATT)6 60.0 
R: CACAACAAACGAGGAAGCCG 
F: CAAATGCGAATGAGCGGGAG 
LF206 (AAAGG) 5 60.0 
R: GGGCAAAAGGGACAGGATGT 
F: ACAGGCTGTGGGATTAGCAC 
LF224 (GAAGG) 5 60.0 
R: GTCGTCAGAGTGGCCAGAAA 
F: GCTACCGTTGCCTCCTTCAT 
LF229 (TTTCC) 5 59.8 
R: TGGTCTTGGAGCAGATGACG 
F: TCTCATCGCACTCCTAGGGT 
LF242 (GAA)9 60.0 
R: GTGAGTGGAGAGGGGGAGAT 
F: GTGCTGGATCTCTGGCACAA 
LF245 (GCA) 9 59.9 


GACCAATGTATCCCGGGGAC 


LF247 


GGAAGTACCACTCCTTCGGC 
GAAACTCCGAATTCGACGCG 


2.4 枫 香 天 然 群体 EST-SSR 遗传 分 析 有 效 性 评价 


用 这 18 对 引物 对 一 个 枫 香 天 然 群 体 的 30 个 档 


本 〈C1~C30) DNA 进 


(GCG)9 60.0 


行 遗传 多 样 性 分 析 ， 扩 增 结果 显 


示 《〈 表 6) ，18 个 位 点 共 扩 增 出 42 个 等 位 基因 数 ， 观 测 等 位 基因 数 (Na) 介 于 2~ 4 之 间 ， 平 均值 为 


2.333 3; 有 效 等 位 基因 
0.208 9~1.1127 之 间 ， 习 


数 (Ne) 介 于 1.112 8~2.609 6 之 间 ， 习 


表 6 18 个 位 点 


的 遗传 多 样 性 


Table 6 Genetic diversity of the 18 loci 


均值 为 1.957 4; Shannon 指数 (7) 介 于 
均值 为 0.708 5; 观测 杂 合 度 CEo) 介 于 0.275 9~1.000 0 之 间 ， 平 均值 为 0.722 6; 
期 望 杂 合 度 (He) 介 于 0.370 6~0.896 8 之 间 ， 平 均值 为 0.522 8。 该 结果 表明 ， 开 发 的 18 对 SSR 引物 可 
于 枫 香 群体 遗传 多 样 性 评价 。 


等 位 基因 有 效 等 位 基因 数 ”Shannon 指数 观测 杂 合 度 期 望 杂 合 度 
位 点 数 Number of Shannon’s 9 Observed Expected 
Locus Number of effective allele diversity index ee heterozygosity heterozygosity 
allele (Na) (Ne) (D “ (Ho) (He) 

LFS3 和 2 1.9976 0.6926 0.499 4 0.862 1 0.491 8 
LF76 3 2.1664 0.914 1 0.338 4 0.880 0 0.450 6 
LEF89 4 2.009 0 1.112 7 0.6168 0.800 0 0.370 6 
LF108 2 1.773 8 0.6279 0.4362 0.714 3 0.555 8 
LF111 3 2.179 4 0.894 3 0.541 2 0.555 6 0.448 6 
LF112 3 2.453 7 0.967 4 0.5925 0.7308 0.3959 
LF128 2 1.989 8 0.6906 0.497 4 0.928 0 0.493 5 
LF129 2 1.112 8 0.208 9 0.101 4 0.964 3 0.8968 
LF171 3 2.179 4 0.878 9 0.541 2 0.5926 0.448 6 
LF177 2 1.996 8 0.6923 0.4992 0.680 0 0.4906 
LF188 2 1.9905 0.690 8 0.4976 0.2759 0.4936 
LF190 2 1.9975 0.6925 0.499 4 0.3929 0.4916 
LF206 2 1.9973 0.6925 0.499 3 0.923 9 0.491 3 
LF224 2 1.337 6 0.419 5 0.252 4 0.777 8 0.742 8 
LF229 2 1.9973 0.6925 0.499 3 0.407 4 0.491 3 
LF242 2 1.973 6 0.087 0 0.493 8 1.000 0 0.496 9 
LF245 2 1.9973 0.6925 0.499 3 0.777 8 0.4913 
LF247 2 1.480 2 0.5055 0.324 4 0.740 7 0.6695 
平均 值 

ee 2.333 3 1.957 4 0.7085 0.468 3 0.7226 0.5228 


3 讨论 与 结论 


3.1 枫 香 转录 组 SSR 位 点 分 布 特征 


SSR 标记 具有 在 植物 种 间 通 
世 鹏 等 , 2018)， 但 目前 可 


性 的 优点 ， 同 属 
j 的 枫 香 SSR 引物 较 少 ， 仅 有 报道 


植物 中 移植 已 有 标记 进行 7 


开发 SSR 的 研究 已 不 少见 ( 杨 


的 顾 辛 韵 “2016) 采用 磁 珠 富 集 法 开发 的 10 


Dts iene Ase NCBI 数据 库 信 息 开 发 了 11 对 引物 。 磁 珠 富 集 法 主要 是 通过 构建 微 卫星 富 
集 文库 ， 经 阳性 克隆 、 筛 选 、 测 序 最 终 得 到 SSR 位 点 信息 ， 该 方法 虽然 在 一 定 程度 上 提高 了 SSR 引物 开 
发 效率 ， 但 操作 过 程 繁琐 且 需 要 构建 和 第 选 基因 组 文库 ， 开 发 难度 较 大 ， 获 得 的 SSR 位 点 信息 有 限 ， 通 
过 NCBI 数据 库 开 发 SSR 引物 的 方法 使 得 研究 者 可 以 从 中 获得 有 效 信息 ， 节 省 了 时 间 和 试验 成 本 ， 但 当 
前 数据 库 中 的 枫 香 序列 数据 有 限 ， 能 够 获得 的 SSR 位 点 信息 较 少 ， 且 无 法 对 枫 香 SSR 位 点 信息 分 布 特征 
进行 详细 地 描述 。 随 着 高 通 量 测序 技术 的 发 展 ，RNA-seq 测序 的 成 本 正 逐 渐 降 低 ， 基 于 转录 组 数据 开发 
EST-SSR 分 子 标 记 ， 目 前 已 经 成 为 基因 发 掘 及 分 子 标 记 开 发 的 重要 技术 手段 。 本 研究 首次 通过 转录 组 测 
序 技术 获得 了 相对 较 多 且 较 全 面 的 枫 香 SSR 位 点 信息 。 本 研究 发 现 ， 作 为 第 三 纪 的 子 遗 植物 ， 枫 香 转录 
组 中 SSR 基 元 重复 类 型 较为 丰富 ， 包 含 了 六 种 核 苷 酸 重 复 的 所 有 类 型 ， 高 比例 的 单 核 背 酸 重复 序列 
(46.54%) 是 枫 香 EST-SSR 的 重要 分 布 特征 ， 其 重复 基 元 分 布 类 型 与 大 花 四 照 花 (Cornus florida) ( 刘 佳 奇 
等 , 2020) 和 黄 枝 油 杉 (Keteleeria calcarea) 相似 〈( 石 远 婷 等 ，2021) 。 整 体 上 看 ， 枫 香 转 录 组 中 SSR 位 
点 的 数量 和 种 类 较为 丰富 ， 为 枫 香 SSR 引物 开发 及 后 续 研究 提供 了 重要 基础 。 
3.2 枫 香 EST-SSR 位 点 开发 效率 
本 研究 所 设计 的 262 对 枫 香 EST-SSR 引物 有 效 扩 增 率 为 53.1%， 祁 雅 等 (2004) 以 及 魏 利 斌 等 
ee (2008) 研究 指出 的 ， 所 设计 EST-SSR 引物 的 有 效 扩 增 率 应 在 60% 一 90% 之 间 。 本 研究 有 效 扩 增 率 较 低 
LO 的 原因 可 能 有 以 下 3 个 方面 : 〈1) 三 至 六 碱 基 重复 类 型 的 SSR 位 点 占 比较 低 (总 计 19.46%) ， 使 得 可 
供 筛选 的 SSR 位 点 总 量 偏 少 ， 〈2) 部 分 引物 设计 不 合理 ， 实 验 中 所 用 引物 均 根 据 二 代 测 序 结果 所 得 ， 二 
代 测 序 在 拼接 过 程 中 可 能 会 存在 一 些 错误 ， 因 而 导致 有 效 扩 增 率 相 对 较 低 ; (3) 本 研究 中 开发 的 枫 香 
SSR 引物 多 态 性 比率 较 低 (15.64%) ， 主 要 是 由 于 SSR 的 潜在 多 态 性 会 随 着 SSR 基 元 重复 次 数 的 增多 
而 增加 《〈 刘 佳 奇 等 ，2020) ， 而 枫 香 主要 基 元 重复 次 数 为 5~12 次 ， 且 主要 基 元 以 短 重 复 类 型 为 主 ， 该 
SSR 位 点 特征 限制 了 枫 香 SSR 的 潜在 多 态 性 。 内 在 原因 主要 是 转录 组 SSR 位 点 来 自 于 序列 相对 保守 的 基 
因 编码 区 ， 其 多 态 性 位 点 一 般 位 于 功能 序列 的 微 卫 星 重 复 片 段 上 ， 从 而 导致 转录 组 SSR 多 态 性 较 低 ( 杨 世 
鹏 等 ，2018) 。 
“3.3 枫 香 EST-SSR 引物 多 态 性 及 群体 遗传 分 析 有 效 性 评价 
之 衡量 SSR 引物 可 用 性 及 多 态 性 丰富 度 可 以 采用 多 态 信息 含量 (PIC) 、 观 测 等 位 基因 数 (Na) 及 有 
效 等 位 基因 数 (Ne) 等 参数 。 在 PIC 指数 方面 ， 孙 荣 喜 (2017) 开发 的 14 对 枫 香 SSR 引物 中 包括 6 个 
- 高 度 多 态 性 位 点 ，4 个 中 度 多 态 性 位 点 ，4 个 低 度 多 态 性 位 点 。 与 前 两 者 的 研究 相 比 ， 本 实验 中 开发 的 18 
:二 对 枫 香 SSR 引物 中 ，10 对 为 高 度 多 态 性 位 点 ，8 对 为 中 度 多 态 性 位 点 ， 多 态 信息 含量 (PIC) 较 高 。 在 等 
pT 位 基因 数 (Na) 方面 ， 孙 荣 喜 (2017) 在 全 国 范围 内 开展 的 中 国 枫 香 树 遗 传 多 样 性 及 谱系 地 理 研究 中 开 
发 的 14 对 枫 香 SSR 引物 ， 其 观测 等 位 基因 数 (Na) 平均 值 为 3.258 0， 有 效 等 位 基因 数 (Ne) 平均 值 为 
1.848 0; 顾 辛 韵 2016) 在 千岛 湖 地 区 开展 的 片断 化 生境 对 枫 香 遗传 多 样 性 影响 的 研究 中 开发 的 10 对 
SSR 引物 ， 观 测 等 位 基因 数 (Na) 均值 为 4.6， 有 效 等 位 基因 数 (Ne) 平均 值 为 2.130 0。 本 研究 所 开发 
18 对 SSR 引物 在 环 江 群体 中 检测 到 的 观测 等 位 基因 数 (Na) 平均 值 为 2.333 3， 低 于 前 两 者 ， 其 原因 是 
观测 等 位 基因 数 (Na) 在 很 大 程度 上 依赖 于 抽取 的 样本 大 小 ， 本 研究 采样 范围 及 数量 较 前 两 者 偏 小 ， 有 
效 等 位 基因 数 (Ne) 平均 值 (1.957 4) ， 与 前 两 者 研究 相近 ， 而 有 效 等 位 基因 数 (Ne) 比 杂 合体 频率 和 
纯 合体 频率 更 好 地 度量 群体 遗传 变异 地 增加 ， 说 明 该 环 江 群体 遗传 多 样 性 较为 丰富 ， 上 述 讨论 说 明 本 研 
究 所 开发 的 SSR 引物 同样 能 够 很 好 地 反映 出 枫 香 群体 遗传 变异 情况 ， 可 适用 于 枫 香 遗传 多 样 性 研究 。 
引物 开发 的 目的 是 为 了 得 到 多 态 信息 含量 (PIC) 高 的 SSR 分 子 标记 。 前 人 研究 中 采用 常规 SSR 分 
子 标记 开发 技术 获得 的 枫 香 序列 有 限 ， 因 此 开发 的 枫 香 SSR 引物 数量 较 少 、 多 态 信 息 含 量 CPIC) 不 高 ， 
本 研究 首次 通过 转录 组 测序 技术 对 枫 香 SSR 位 点 信息 进行 了 较为 全 面 的 发 掘 ， 可 高 效 地 获得 枫 香 某 一 发 
育 时 期 细胞 全 部 转录 本 信息 ， 并 克服 了 步骤 繁琐 、 时 间 和 人 力 成 本 高 的 问题 。 由 此 自主 设计 枫 香 EST-SS 
R 引物 ， 并 对 其 有 效 性 及 多 态 性 进行 验证 ， 得 到 了 18 对 尚未 开发 的 多 态 信 息 含 量 (PIC) 较 高 的 枫 香 ES 
TSSR 引物 ， 有 效 性 评价 结果 显示 这 18 对 枫 香 SSR 引物 均 可 用 于 后 续 枫 香 遗 传 多 样 性 分 析 、 枫 香 种 质 资 
源 的 保护 研究 中 ， 在 前 人 的 基础 上 拓展 了 当前 栅 香 SSR 引物 数量 和 种 类 。 由 群体 验证 结果 可 知 ， 不 同 的 


EST-SSR 分 子 标记 在 群体 表达 上 存在 一 定 的 差异 ， 说 明 不 同位 点 所 在 基因 的 进化 速率 存在 着 差异 ， 多 态 
性 较 低 的 SSR 位 点 多 位 于 保守 基因 上 《〈 刘 佳 奇 等 ，2020) 。 通 过 转录 组 测序 技术 开发 的 枫 香 EST-SSR 引 
物 除 用 于 遗传 多 样 性 分 析 外 ， 一 方面 可 通过 其 位 点 特征 回溯 所 在 基因 的 固定 或 进化 情况 ， 以 探究 群体 遗 
传 分 化 问题 ， 另 一 方面 结合 转录 组 信息 可 开展 位 点 所 在 序列 基因 功能 性 研究 ， 既 可 用 于 构建 优良 表 型 关 
联 的 特异 SSR 标记 ， 还 可 为 后 续 深 入 开展 枫 香 时 色 变 化 分 子 机 理 、 枫 香 药 用 活性 成 分 的 合成 等 研究 提供 
一 定 的 帮助 。 对 于 枫 香 种 质 资源 的 开发 、 保 在 和 利用 有 着 重要 的 指导 意义 。 

综 上 所 述 ， 本 研究 基于 转录 组 测序 技术 获得 了 较为 全 面 的 枫 香 SSR 位 点 信息 ， 成 功 开 发 出 18 对 枫 香 
EST-SSR 引 物 ， 对 枫 香 中 高 度 多 态 性 SSR 引 物 的 数量 提供 了 必要 的 补充 ， 为 解决 当前 枫 香 中 高 多 态 性 SSR 
引物 数量 和 种 类 不 足以 支撑 更 深入 地 进行 枫 香 遗传 多 样 性 研究 的 问题 提供 了 帮助 ， 为 枫 香 群体 遗传 学 、 
分 子 辅助 育种 等 研究 提供 了 更 多 、 更 好 的 研究 工具 。 
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